شرح گذاری خودکار تصویر با رویکرد استخراج فضای ویژگی به صورت غیرخطی

پایان نامه
چکیده

بازیابی تصویر مبتنی بر محتوی (cbir)، به معنای بازیابی تصاویر با استفاده از ویژگی های سطح پایین همچون رنگ، بافت و شکل می باشد. در این نوع بازیابی، شکاف معنایی به معنای اختلاف در تفسیر تصاویر، بین انسان و الگوریتم کامپیوتری می باشد. برای کاهش این فاصله، بهتر است تا ابتدا کاربر انسانی تصاویر پایگاه تصویر را شرح گذاری کند و سپس بازیابی از تصاویر شرح گذاری شده انجام پذیرد. به دلیل تعداد زیاد تصاویر در پایگاه های تصویری، شرح گذاری تمامی آنها توسط انسان امکان پذیر نمی باشد. با توجه به حجم انبوه تصاویر در حوزه های مختلف و رشد روزافزون این تصاویر، نیاز به روش های کامپیوتری که به صورت خودکار شرح گذاری را بر روی این تصاویر انجام دهند امری ضروری می باشد. اولین الگوریتم شرح گذاری که تنها از ویژگی رنگ در آن استفاده می گردید در سال 1996 ارائه گردید. در این الگوریتم ها، جهت یادگیری روش شرح گذاری که توسط انسان انجام می شود، از چهار رویکرد آماری، مبتنی بر طبقه بند، مبتنی بر گراف و مبتنی بر جستجو در وب استفاده می شود. در این حوزه، نگاشت غیرصحیح ویژگی های سطح پایین تصویر به معانی سطح بالا، سبب می شود تا دقت شرح گذاری کاهش یابد. در روش هایی که تاکنون در شرح گذاری تصویر ارائه گردیده است، پس از استخراج بردارهای ویژگی رنگ، بافت و شکل، تحلیلی در موضوع فضای معنا و فضای ویژگی صورت نپذیرفته است. هر چند که با تغییر در بافت، رنگ و یا شکل تصویر، از نظر انسان معنا تغییری نکرده است، ولی به دلیل تغییر غیر پیوسته در بردار ویژگی های سطح پایین تصویر، شرح گذاری در تمامی موارد به درستی انجام نمی شود. در این رساله جهت همسو سازی فضای ویژگی با فضای معنا، از رویکرد کاهش ابعاد بردارهای ویژگی به صورت غیر خطی استفاده می شود. کاهش ابعاد بردارهای ویژگی به صورت غیرخطی که یادگیری منیفلد نیز نامیده می شود به معنای جستجوی ساختارهایی با ابعاد کم است که به صورت ذاتی و غیرخطی در مشاهدات با ابعاد بالا وجود دارد. تحقیقات پایه در روش های یادگیری منیفلد از سال 1998 با ارائه روش ایزومپ آغاز گردیده است. در این رساله در راستای حل دو مسأله حساسیت به نویز و نیز عدم استفاده از داده های برچسب دار در روش های پایه یادگیری منیفلد و همچنین در راستای کاربردی سازی یادگیری منیفلد در شرح گذاری خودکار تصویر، دو مدل بدون نظارت و بانظارت در یادگیری منیفلد ارائه شده است. در مدل بدون نظارتی، تمامی داده ها بدون برچسب هستند و در مدل بانظارتی، از برچسب داده های برچسب دار استفاده شده است. نوآوری اصلی در مدل بدون نظارتی، استخراج یک فضای ویژگی از چند فضای ویژگی می باشد که با رویکرد ارائه شده در این مدل، اثر منفی نویز در دقت یادگیری منیفلد کاهش می یابد. با نتایج بدست آمده از مدل بدون نظارتی، مدل بانظارت ارائه گردیده است. نوآوری اصلی ارائه شده در این مدل، چگونگی انتقال معانی از فضای معنا به فضای ویژگی با استفاده از عملگر ضرب معنایی می باشد. در ارزیابی دو مدل پیشنهادی در رسیدن به اهداف این رساله، از دادگان های بخش b از mpeg-7، fish، corel 5k و iapr tc-12 استفاده شده است. مدل بدون نظارت در دادگان بخش b از mpeg-7 سبب افزایش دقت بازیابی از 94/84% در روش ایزومپ به 73/89% در روش پیشنهادی گردیده است. موثر بودن این مدل در دادگان fish نیز نسبت به روش ایزومپ در نمودارهای دقت و فراخوان آورده شده است. مدل بانظارت نیز در دادگان های بخش b از mpeg-7، corel 5k و iapr tc-12 به ترتیب سبب افزایش دقت از 22/97% به 64/98% و افزایش f1 از 0.21 به 312/0 و 2/0 به 302/0 در استفاده از فضای منیفلد به جای فضای مشاهده، گردیده است.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

طبقه بندی زعفران با استفاده از ویژگی های رنگی استخراج شده از تصویر

طبقه­بندی زعفران به عنوان گران­ترین ادویه از اهمیت بالایی برای مشتریان و تجار برخوردار است. به طور کلی، در حال حاضر دو روش برای درجه­بندی زعفران استفاده می­شود. روش اول براساس تجربیات فرد خبره و با مشاهده نمونه­ها انجام می­شود. روش دوم تخریبی بوده و با استفاده از متدهای آزمایشگاهی انجام می­گیرد. طبق نظر متخصصان، استفاده از تکنیک­های یادگیری ماشین برای طبقه­بندی زعفران به دلیل داشتن ماهیت غیر مخ...

متن کامل

مقایسه تأثیر وضعیت طاق باز و دمر بر وضعیت تنفسی نوزادان نارس مبتلا به سندرم دیسترس تنفسی حاد تحت درمان با پروتکل Insure

کچ ی هد پ ی ش مز ی هن ه و فد : ساسا د مردنس رد نامرد ي سفنت سرتس ي ظنت نادازون داح ي سکا لدابت م ي و نژ د ي سکا ي د هدوب نبرک تسا طسوت هک کبس اـه ي ناـمرد ي فلتخم ي هلمجزا لکتورپ INSURE ماجنا م ي دوش ا اذل . ي هعلاطم ن فدهاب اقم ي هس عضو ي ت اه ي ندب ي عضو رب رمد و زاب قاط ي سفنت ت ي هـب لاتـبم سراـن نادازون ردنس د م ي سفنت سرتس ي لکتورپ اب نامرد تحت داح INSURE ماجنا درگ ...

متن کامل

کاهش شکاف مفهومی در بازیابی تصویر با رویکرد بهبود اثر تلفیق در یادگیری منیفلد

بازیابی تصویر مبتنی بر محتوی، به معنای بازیابی تصاویر با استفاده از ویژگی‌های سطح پایین همچون رنگ، بافت و شکل می‌باشد. در این نوع بازیابی، شکاف معنایی به معنای اختلاف در تفسیر تصاویر، بین انسان و الگوریتم کامپیوتری می‌باشد. در این حوزه، نگاشت غیرصحیح ویژگی‌های سطح پایین تصویر به معانی سطح بالا، سبب می‌شود تا شکاف معنایی افزایشیابد. در بازیابی تصویر، چنانچه با تغییر در بافت، رنگ و یا شکل تصویر، ...

متن کامل

کنترل بهینة غیرخطی وسایل بازگشت‌پذیر بر پایه استخراج ماتریس‌های سیستمی وابسته به متغیرهای حالت و کنترل در فرم فضای حالت

در مأموریت‌های فضایی وسایل بازگشت‌پذیر (Reentry Vehicle)، فاز بازگشت به جو از مهمترین مراحل مأموریت می‌باشد. به همین دلیل، هدایت و کنترل وسیلة بازگشت‌پذیردر این فاز مأموریت از اهمیت ویژه‌ای برخوردار است. در این مقاله یک الگوی هدایت و کنترل بهینه‌ برای وسایل بازگشت‌پذیر ارائه می‌شود که در برابر عدم قطعیت در پارامترهای ورودی مقاوم باشد. برای استفاده از هر نوع روش هدایتی، ابتدا باید معادلات حرکت و...

متن کامل

پرتو حسن در شرح حدیث صورت

درحدیث است که رسول خدا (ص)فرمودند((ان الله خلق آدم علی صورته )) یعنی خدای آدمیان را بر صورت خود آفریده است . این حدیث که مشهور به حدیث صورت است از دیرباز محل اختلاف اهل نظر گردیده و هرکس فراخور فهم و بینش و ظرفیت خود درباره آن اظهار نظر کرده است ‘ برخی با ظاهر بینی با استناد به این حدیث و مانند آن در ورطه تشبیه گرفتار آمده و به کافران پیوسته اند ‘ گروهی نیز با پای چوبین در این وادی گام نهاده ا...

متن کامل

تحلیل «نقاشی به منزلۀ تصویر» براساس شرح دلوز از انواع تصویر و شروط ظهور آنها

بیان مسئله: دربارۀ چیستی انواع تصویر و شروط همبستۀ ظهورِ سنخ‌های مختلف آنها نزد دلوز است. هدف پژوهش: مقاله مشتمل بر دو مؤلفه یعنی روشن‌کردن انواع تصویر، شرایط ظهور آنها با تأکید بر زمان و نیز تعیین نوع تصویر یک اثر نقاشی با توجه به شرایط ظهور آن است. فرض مقاله این است که تعیین شرایط ظهور تصاویر به تشخیص نوع آن کمک می‌کند. برای روشن‌شدن سنخ تصویر، شرایط ظهور آن تصویر مطالعه می‌شود. برای سهو...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده مهندسی برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023